ИГР ТЕОРИЯ: ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ - significado y definición. Qué es ИГР ТЕОРИЯ: ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ
Diclib.com
Diccionario en línea

Qué (quién) es ИГР ТЕОРИЯ: ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ - definición

Игра в нормальной форме; Платёжная матрица

ИГР ТЕОРИЯ: ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ      
К статье ИГР ТЕОРИЯ
Первый шаг при построении общей математической теории игр состоит в доказательстве того, что любую конечную игру можно свести к эквивалентной ей игре, имеющей более простую частную форму; в отличие от игры с полной информацией такие игры сопряжены с минимальным обменом информацией. Предположим, что n игроков X1, X2, ..., Xn играют в игру Г по следующим правилам. Каждый игрок Xk выбрал из множества Sk элемент xk, ничего не зная о том, какой элемент выбрал любой из остальных игроков; в качестве платежа игрок Xk получает величину Mk (x1, x2, ..., xn). Точный характер игры Г определяется множествами S1, S2, ..., Sn и n функциями платежей M1, M2, ..., Mn. Элементы множества Sk называются чистыми стратегиями игрока Xk.
Любая игра, которая может быть представлена таким образом, называется игрой с "нулевой суммой", если функции платежей удовлетворяют условию
при всех возможных выборах стратегий x1, x2, ..., xn. Смысл этого названия заключается в том, что игра не разрушает и не создает состояния, а лишь перераспределяет его между игроками. Любую игру в нормальной форме можно превратить в игру с нулевой суммой, если ввести фиктивного игрока ("банк"), который не делает ходов, но получает платеж в размере, необходимом для поддержания общего баланса. В игре двух игроков с нулевой суммой условие (1) принимает вид:
Следовательно, игрок X1 выигрывает, только если игрок X2 проигрывает, и интересы игроков диаметрально противоположны. Но если число игроков больше двух, то существует возможность объединения нескольких игроков в коалицию для достижения совместными усилиями того, что они не могли достичь порознь.
Чтобы уяснить, как обычную игру можно теоретически свести к нормальной форме, нужно глубже вникнуть в то, что понимается под "стратегией" в теории игр. В самых общих чертах стратегия игрока представляет собой детальный план действий, который может быть составлен заранее, до того, как игра действительно будет сыграна, и содержит полные инструкции, необходимые для принятия любого возможного решения; решение должно учитывать всю информацию, которой располагает игрок относительно предыдущих ходов, сделанных во время игры.
В шашках или шахматах описание индивидуальной стратегии белых составило бы объемистую книгу; в ней не только указывался бы первый ход, но и перечислялись бы контрходы в ответ на любой ответный ход черных, перечислялись бы все возможные вторые ходы, ответные ходы белых на любой второй ход черных и т.д.
В "упрощенном покере" у игрока X имеется только четыре возможные стратегии. Их можно обозначить символами LL, LH, HL и HH, означающими следующее:
6LL - независимо от извлеченной карты ставка минимальна (3 доллара);
6LH - если извлеченная карта - королева, то ставка минимальна, если король, то ставка максимальна (9 долларов);
HL - стратегия, обратная LH;
6HH - ставка всегда максимальна.
Аналогично, игрок Y располагает только четырьмя стратегиями, которые можно было бы обозначить FF, FC, CF и СС:
6FF - пропустить независимо от ставки, которую делает игрок X;
6FC - пропустить, если X делает минимальную ставку, объявить козырную масть, если X делает максимальную ставку;
CF - стратегия, обратная FC;
CC - объявить козырную масть независимо оттого, какую ставку делает X.
После того, как каждый из игроков выбрал свою стратегию, игру мог бы проводить любой беспристрастный посредник. В этом смысле платеж для каждого игрока полностью определен выбором чистых стратегий, и мы получаем требуемую нормальную форму. Игра с многочисленными ходами и в различной степени неполной информацией оказалась сведенной к простой игре, в которой у каждого игрока есть только один ход. Если имеются случайные ходы (в нашем примере с покером - это начальная сдача карт), то их делает посредник. Разумно также описать платеж, причитающийся игроку, в терминах величины, которую он рассчитывает получить. Например, если X выбирает стратегию HL, а Y - стратегию CC, то X выигрывает 3 доллара, если он извлекает короля, и проигрывает 9 долларов, если он извлекает королеву. Так как предполагается, что игра ведется честно, то ожидаемый в конечном счете платеж при указанном выборе стратегий составляет
Полная матрица для нормальной формы "упрощенного покера" представлена на рис. 2. Платежи указаны для игрока X; соответствующие платежи для Y равны тем же числам, но с противоположным знаком.
В России при построении математической модели конфликта делают различия между коалицией действия и коалицией интересов. Коалицией действия называются те или иные коллективы, участвующие в игре и принимающие решения. Коалицией интересов называются коллективы, участвующие в игре и отстаивающие некоторые общие интересы. Кроме того, вводится понятие ситуации - результат выбора всеми коалициями действия своих стратегий.
Нормальная форма игры         
В теории игр, игра в нормальной или стратегической форме () состоит из трех элементов: множества игроков, множества чистых стратегий каждого игрока, множества платежных функций каждого игрока. Таким образом, игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы), элементы которой это n-мерные платежные вектора. Эта таблица называется платёжной матрицей ().
Игр теория         
  • премии по экономике памяти Альфреда Нобеля]]
  • Ультиматум]]» в развёрнутой форме

раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. Отдельные математические вопросы, касающиеся конфликтов, рассматривались (начиная с 17 в.) многими учёными. Систематическая же математическая теория игр была детально разработана американскими учёными Дж. Нейманом и О. Моргенштерном (1944) как средство математического подхода к явлениям конкурентной экономики. В ходе своего развития И. т. переросла эти рамки и превратилась в общую математическую теорию конфликтов. В рамках И. т. в принципе поддаются математическому описанию военные и правовые конфликты, спортивные состязания, "салонные" игры, а также явления, связанные с биологической борьбой за существование.

В условиях конфликта стремление противника скрыть свои предстоящие действия порождает неопределённость. Наоборот, неопределённость при принятии решений (например, на основе недостаточных данных) можно интерпретировать как конфликт принимающего решения субъекта с природой. Поэтому И. т. рассматривается также как теория принятия оптимальных решений в условиях неопределённости. Она позволяет математизировать некоторые важные аспекты принятия решений в технике, сельском хозяйстве, медицине и социологии. Перспективен подход с позиций И. т. к проблемам управления, планирования и прогнозирования.

Основным в И. т. является понятие игры, являющееся формализованным представлением о конфликте. Точное описание конфликта в виде игры состоит поэтому в указании того, кто и как участвует в конфликте, каковы возможные исходы конфликта, а также кто и в какой форме заинтересован в этих исходах. Участвующие в конфликте стороны называются коалициями действия; доступные для них действия - их стратегиями; возможные исходы конфликта - ситуациями (обычно каждая ситуация понимается как результат выбора каждой из коалиций действия некоторой своей стратегии); стороны, заинтересованные в исходах конфликта, - коалициями интересов; их интересы описываются предпочтениями тех или иных ситуаций (эти предпочтения часто выражаются численными выигрышами). Конкретизация перечисленных объектов и связей между ними порождает разнообразные частные классы игр.

Если в игре имеется единственная коалиция действия, то стратегии этой коалиции можно отождествить с ситуациями и далее больше уже о стратегиях не упоминать. Такие игры называются нестратегическими. Класс нестратегических игр весьма обширен. К их числу относятся, в частности, кооперативные игры (см. Кооперативная теория игр).

Примером нестратегической (кооперативной) игры может служить простая игра, состоящая в следующем. Множеством ситуаций являются в ней всевозможные распределения (дележи) между игроками некоторого количества однородной полезности (например, денег). Каждый делёж описывается теми суммами, которые при этом получают отдельные игроки. Коалиция интересов называется выигрывающей, если она может даже в условиях противодействия со стороны всех остальных игроков присвоить и разделить между своими членами всю имеющуюся полезность. Все коалиции, не являющиеся выигрывающими, совсем не могут присвоить какой-либо доли полезности. Такие коалиции называются проигрывающими. Естественно считать, что выигрывающая коалиция предпочитает один делёж другому, если доля каждого из её членов в условиях первого дележа больше, чем в условиях второго. Проигрывающие же коалиции не могут сравнивать дележи по предпочтительности (это условие также вполне естественно: коалиция интересов, которая сама не в состоянии добиться ничего, вынуждена соглашаться на любой делёж и лишена возможности выбора между дележами).

Если в игре имеется более одной коалиции действия, то игра называется стратегической. Важный класс стратегических игр составляют бескоалиционные игры, в которых коалиции действия совпадают с коалициями интересов (они называются игроками), а предпочтения для игроков описываются их функциями выигрыша: игрок предпочитает одну ситуацию другой, если в первой ситуации он получает больший выигрыш, чем во второй.

Одним из простейших примеров бескоалиционной игры может служить "морра" в следующем своём варианте. Три игрока показывают одновременно 1 или 2 пальца каждый. Если все три игрока показывают одно и то же число, то выигрыш каждого равен нулю. В противном случае один из игроков показывает a ( = 1 или 2) и получает b из некоторого источника (например, из банка, образованного предварительными взносами), а два других игрока, показывающие одно и то же b ( ≠ a), не получают ничего.

Если в бескоалиционной игре участвуют два игрока, а значения их функций выигрыша в любой ситуации отличаются только знаками, то игра называется антагонистической игрой (См. Антагонистические игры); в ней выигрыш одного из игроков в точности равен проигрышу другого. Если в антагонистической игре множества стратегий обоих игроков конечны, то игра называется матричной игрой (См. Матричные игры) ввиду некоторой специфической возможности её описания.

В качестве другого примера бескоалиционной игры можно привести шахматы. В этой игре участвуют два игрока (белые и чёрные). Стратегия каждого из игроков есть мыслимое (хотя практически и не поддающееся детальному описанию) правило выбора в каждой возможной позиции некоторого хода, допускаемого движениями фигур. Пара таких правил (за белых и за чёрных) составляет ситуацию, которая полностью определяет протекание шахматной партии и в том числе её исход. Функция выигрыша белых имеет значение 1 на выигрываемых партиях, 0 на ничейных и - 1 на проигрываемых (такой способ начисления очков практически ничем не отличается от принятого в турнирной и матчевой практике). Функция выигрыша чёрных отличается от функции выигрыша белых лишь знаком. Из сказанного видно, что шахматы относятся к числу антагонистических и притом матричных игр. В шахматах стратегии не выбираются игроками до начала игры, а реализуются постепенно, ход за ходом. Это значит, что шахматы принадлежат к позиционным играм (См. Позиционные игры).

И. т. является нормативной теорией, тоесть предметом её изучения являются не столько сами модели конфликтов (игры), как таковые, сколько содержание принимаемых в играх принципов оптимальности, существования ситуаций, на которых эти принципы оптимальности реализуются (такие ситуации или множества ситуаций называются решениями в смысле соответствующего принципа оптимальности), и, наконец, способы нахождения таких ситуаций. Рассматриваемые в И. т. объекты - игры - весьма разнообразны, и пока не удалось установить принципов оптимальности, общих для всех классов игр. Практически это означает, что единого для всех игр истолкования понятия оптимальности ещё не выработано. Поэтому прежде чем говорить, например, о наивыгоднейшем поведении игрока в игре, необходимо установить, в каком смысле эта выгодность понимается. Все применяемые в И. т. принципы оптимальности при всём их внешнем разнообразии отражают прямо или косвенно идею устойчивости ситуаций или множеств ситуаций, составляющих решения. В бескоалиционных играх основным принципом оптимальности считается принцип осуществимости цели, приводящий к ситуациям равновесия. Эти ситуации характеризуются тем свойством, что любой игрок, который отклонится от ситуации равновесия (при условии, что остальные игроки не изменят своих стратегий), не увеличит этим своего выигрыша.

В частном случае антагонистических игр принцип осуществимости цели превращается в так называемый принцип максимина (отражающий стремление максимизировать минимальный выигрыш).

Принципы оптимальности (первоначально выбиравшиеся интуитивно) выводятся на основании некоторых заранее задаваемых их свойств, имеющих характер аксиом. Существенно, что различные применяемые в И. т. принципы оптимальности могут противоречить друг другу.

Теоремы существования в И. т. доказываются преимущественно теми же неконструктивными средствами, что и в других разделах математики: при помощи теорем о неподвижной точке, о выделении из бесконечной последовательности сходящейся подпоследовательности и т. п., или же, в весьма узких случаях, путём интуитивного указания вида решения и последующего нахождения решения в этом виде.

Фактическое решение некоторых классов антагонистических игр сводится к решению дифференциальных и интегральных уравнений, а матричных игр - к решению стандартной задачи линейного программирования (См. Линейное программирование). Разрабатываются приближённые и численные методы решения игр. Для многих игр оптимальными оказываются так называемые смешанные стратегии, тоесть стратегии, выбираемые случайно (например, по жребию).

И. т., созданная для математического решения задач экономического и социального происхождения, не может в целом сводиться к классическим математическим теориям, созданным для решения физических и технических задач. Однако в различных конкретных вопросах И. т. широко используются весьма разнообразные классические математические методы. Кроме этого, И. т. связана с рядом математических дисциплин внутренним образом. В И. т. систематически и по существу употребляются понятия теории вероятностей. На языке И. т. можно сформулировать большинство задач математической статистики. Необходимость при анализе игры количественного учёта неопределённости предопределяет важность и тем самым связь И. т. с теорией информации и через её посредство - с кибернетикой. Кроме того, И. т., будучи теорией принятия решений, может рассматриваться как существенная составная часть математического аппарата операций исследования (См. Операций исследование).

И. т. применяется в экономике, технике, военном деле и даже в антропологии. Основные трудности практического применения И. т. связаны с экономической и социальной природой моделируемых ею явлений и недостаточным умением составлять такие модели на количественном уровне.

К 70-м гг. 20 в. число публикаций по научным вопросам И. т. достигло многих сотен (в том числе несколько десятков монографий). Курсы по И. т. читаются во многих высших учебных заведениях для студентов математических и экономических специальностей (в СССР - с 1956).

Международные конференции по И. т. проходили в Принстоне (1961), Иерусалиме (1965), Вене (1967) и Беркли (1970). Всесоюзные конференции по И. т. состоялись в Ереване (1968) и Вильнюсе (1971).

Лит.: Нейман Дж. Моргенштерн О., Теория игр и экономическое поведение, пер. с англ., М., 1970; Льюс Р., Райфа Х., Игры и решения, пер. с англ., М., 1961; Карлин С., Математические методы в теории игр, программировании и экономике, пер. с англ., М., 1964; Воробьев Н. Н., Современное состояние теории игр, "Успехи математических наук", 1970, т. 25, № 2(152), с. 80-140; Оуэн Г., Теория игр, пер. с англ., М., 1971; Contributions to the theory of games, v.1-4, Princeton, 1950-59; Advances in game theory, Princeton, 1964.

Н. Н. Воробьев.

Wikipedia

Нормальная форма игры

В теории игр, игра в нормальной или стратегической форме (англ. normal form) состоит из трех элементов: множества игроков, множества чистых стратегий каждого игрока, множества платежных функций каждого игрока. Таким образом, игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы), элементы которой это n-мерные платежные вектора. Эта таблица называется платёжной матрицей (англ. payoff matrix).